[AKIBA.AWS ONLINE #07]Redshift内のデータの活用をAthenaにオフロードしてみた[資料公開]
データアナリティクス事業本部の鈴木です。
11月12日 (金) に開催された「AKIBA.AWS ONLINE #07」にて、「Redshift内のデータの活用をAthenaにオフロードしてみた」というタイトルで登壇しました。
資料
概要のご紹介
以下の内容をご紹介しました。
- Redshiftでのアンロード時にCLEANPATHオプションを指定するとアンロード先のパーティションのデータが、Redshift のデータと整合する。
- Athenaでアンロードされたデータを検索する際はパーティション射影を使うとメタデータを管理する必要がなくなる。
- パーティション射影の型には各々の特徴があり、設計時に考慮する必要がある。
まとめ
Redshift内のデータをS3にエクスポートする際のポイントと、Athenaから検索する際のポイントをご紹介しました。
ご参考になれば幸いです。